Есть такой известный в аналитике метод определения спамности текста: сжимаемость
Чем больше повторений ключевых слов в тексте, больше одинаковых двух, трех словников и т.д., тем лучше он сжимается.
Берем очищенный от тегов текст. Сжимаем его...
Хорошо бы, чтобы сразу запускать проверку всех выбранных (видимых) сайтов. Очень помогло бы сэкономить время после каждого апа :)
Проверку можно сделать как последовательную, так и параллельную. Через XML, например отлично несколько проектов...
Часто в начало-конец урла, например, попадают пробелы - табуляция, еще какие-то пробельные символы. Это не чистится сабмиттером.
Хорошо бы или автоматом или по кнопке чистить такой мусор.
Постоянно приходится все через текстовые файлы загружать, а почему?
Может я храню данные в других программах. Двойной экспорт-импорт получается приходится каждый раз делать.
Сделайте просто поле для вставки данных
А что мешает?
Можно еще ими разные шинглы/пассажи проверять.
Тогда можно будет уменьшить кол-во проверок каждым поисковиком, чтобы снизить нагрузку на них и меньше каптчи ловить.
А если не уменьшать, то увеличивается полнота поиска. Плагиат...
В анализаторе позиций и подборе ключевых слов часто дублирующаяся информация.
Хорошо бы чтобы в анализаторе позиций брался вордстат из базы ключевиков (два раза одно и то же парсить сложно, особенно когда ключевиков масса).
В подборе ключевых...